上一篇我們認識了基本的 R-CNN 和 Fast-RCNN,接著來看 Faster RCNN!
Faster RCNN
Fast R-CNN的改進,包括了減少在 R-CNN 重複提取特徵的缺點,將 ROI 映射到 feature maps 上,並用 ROI pooling 統一維度等等。
但是為了迎來更快的偵測速度,在 Proposals 上的處理也需要更有效率。
Faster RCNN 就是依據前兩個模型為基礎做改進,主要是以"RPN"和"Anchor box"的配合取代了 Selective Search!
RPN:接收一個 feature map 作為輸入 ,輸出一系列目標物體出現可能性較高的候選框。
Anchor box:使用 RPN 的目標是對候選框的回歸,而網絡不可能自動生成任意大小的候選框,這時就需要 Anchor ,Anchor 會根據feature map 在原圖片上劃分出很多大小、寬高比不相同的 Anchor box。
feature map 上一個像素可以映射到原圖上 16 x 16 的區域大小,然後按照 1:2 ,1:1 ,2:1 三種比例生成 Anchor box。
機器只取機率前 300 高的 anchor box 進入後面的程序,這樣足以獲得很好的結果,也同時節省運算時間。那要怎麼辨別 anchor box 的去留呢?
IoU:Intersection over union,框框的交集面積除以框框的聯集面積,值會介於 0~1 之間(0 表示預測位置與標準答案之間一點邊都沒碰到;1 表示預測位置完全吻合標準答案)
圖片來源1
圖片來源2
論文